语言研究的超学科意识
The following article is from 语言学通讯 Author 通讯君
文章探讨语言研究为什么以及如何协同相关学科。语言不纯粹是语言现象的语言,同时还是具有神经生理载体的语言,能够运作的语言。从语言如此基本特性出发,笔者重点论证构建理论模式的超学科意识,及其假设模式—汇集验证的科学方法。在超学科意识的关照下,笔者就理论模式的构建和验证,讨论了四大问题:宏观架构、符号和关系、理论过程和认知过程以及概括性和使用分布。在和语言系统基本特性保持一致的前提下,笔者论证了处理四大问题的有效方略。
关键词:认知语言学;神经认知语言学;神经科学;人工智能;超学科研究
1. 超学科的思考
超学科语言研究,顾名思义,就是超越单一的研究对象;语言研究不再停留在语言现象(或言语)的分析和描述上。超学科语言研究是一种“特殊”的交叉跨学科研究,具体表现在它多种“学科”的协同工作。但是,超学科语言研究的理论目标只能是语言系统(即内化语言),而跨学科的研究目标可以是各种各样的。例如,语言哲学的跨学科研究,它的研究目标可以是哲学问题;又如,许多神经语言学的跨学科研究,它的研究目标可限于某语言局部的大脑功能区位;两者的理论表述目标都不是语言系统。虽然超学科语言研究也采用和其它相关学科协同实施的范式,但其理论目 标仍然也必须是语言系统。
既然理论目标是语言系统,为什么要采用超学科的研究范式? 研究者又如何有效实施超学科研究? 提倡超学科语言研究的主要目的,自然是为了更合理地来表述语言基本属性(详见第2小节)。这些基本属性的表述又促使其采用模式假设—汇集验证的科学研究方法(详见第3小节)。其验证所汇集的依据包括:语言现象以及和语言相关的心理行为、社会行为、神经网络特征、类脑智能运算等。假设的理论模式,通过这些汇集验证,更有效逼近实在语言系统。如此汇集验证,需要和认知科学群相关学科协同工作(见第4小节)。协同工作又将为模式构建提供诸多帮助(详见第5小节) 。
2. 语言界定
语言研究的超学科意识和语言本身的基本特征密切相关。人类语言反映了人的三大本质属性:生理性、社会性和思维性(参见乐国安 1986);为此,人类语言是生理个体的,社会文化的和思维认知的(程琪龙 2011)。科学论证起始于不证自明的科学公设,并以科学公设作为论证的基本前提。基于语言的三大基本属性,不证自明的语言科学前提,至少包括语言的物质性和物质语言的动态性。下文对这两个不证自明的基本特征予以说明。
2.1 语言的物质性
语言的物质载体至少有两个:大脑神经网络以及物理声音(其中前者是所有人都必有的)。前者称为语言系统,后者称为语言现象(或言语)。无论是语言系统,还是语言现象,它们都存在于各自的物质载体中。物质语言的陈述是不证自明的,可以作为理论论证的科学公设和前提。
语言的两个不同物质载体,至少有三个显著差异值得关注。(1)语言系统的神经网络载体是多维复杂的系统,而语言现象主要是线性的;两者不同构。(2)语言系统是可自调节的生命体,是动态的;而具体语言现象不是变化着的生命体。(3)语言系统是个人的,而语言现象是社会共享的。
2.2 语言的动态性
有生命大脑神经网络自然是动态的,所以语言系统也是动态的。语言系统的动态性可以从两个角度陈述。一个是语言系统和语言现象之间的关系,一个是语言系统在不同时间段的形态。语言系统和语言现象处于互相依赖的互为因果的关系中。现象是系统的输入和输出,是动态外因;系统是处理这些输入输出的神经生理的自适应动态系统,是动态内因。自适应动态语言系统,在处理相关信息的同时,其神经通路联结权值和阈值作出适应性改变(视为神经联结的学习),在以后言语群体的交流中,处理输入输出信息会变得更有效。由于语言系统是可自调节的,所以交流于同一个社群中的每一个个体系统也带有一定的社会性。这一语言系统和语言现象之间的动态互动观点,称作语言动态观;它陈述语言的动态性,即语言系统和语言现象的互动动态关系。语言系统的动态性也是不证自明的;因此,也可以作为合理的科学公设和科学论证的前提。
神经系统(包括以神经网络为物质基础的语言系统)的动态性早已被神经解剖学证实。任何脑功能区位也都是可以操作的,大脑神经网络中没有不可以操作运算的神经通路或联结关系。因此,语言系统的动态性有理由作为语言科学论证的公设和前提。
语言的动态性在不同时间单位分出系统三类不同的动态运作,其中包括:(1)语言现象的产出和理解的系统操作认知过程;(2)语言系统的发展形成认知过程;(3)从原始语言到当代语言的演化认知过程。其中第一类是瞬间的,是其它两类的基础。语言的发展和演化过程,是人们在具体语境操作中,语言系统神经联结关系自适应的变化过程。
总之,语言系统的神经性和动态性是两条不证自明的科学公设,最有资格作为理论论证的重要前提。细言之,语言系统的神经生理性和操作动态性,是语言超学科论证的重要科学前提;两者可以合而简称为动态神经生理性或神经生理动态性。合理的语言系统理论模式,一定不悖于语言系统的动态神经生理性。因此,语言系统的合理性可以基于神经科学扫脑实验结果来进行验证。
3. 理论目标和方法
超学科研究也坚持认为,解释语言就是理论陈述其因果关系。要解释语言现象的成因,就需要表述语言系统及其理解和产出语言现象的认知过程。要解释语言系统的成因,就需要表述语言系统从原始形态到现代形态的演化认知过程,以及从婴儿初生形态到成熟形态的发展形成认知过程。概言之,要解释语言的成因,需要陈述的理论目标是动态语言系统。鉴于语言系统和语言现象之间的因果关系,理论目标必须是陈述具有神经动态性的语言系统。问题是,能观察到的是语言现象,而不是语言系统。
既然理论目标是语言系统,它又是无法直接观察到的系统,而且语言系统和语言现象又不同构,所以基于语言现象解析和描写的理论陈述,都是假设性的。简言之,任何理论表述的语言和实在语言系统有可能不是一致的。假设性的理论陈述,必须通过严格细致的验证和论证。语言超学科研究力图通过验证和论证,进一步逼近实在语言系统。语言系统理论模式的合适性验证和论证,始于不证自明的语言系统基本特征,主要是语言系统的动态神经生理可行性。其中包括理论模式的操作神经可行性、发展神经可行性和演化神经可行性,但最基本的是理论模式的神经操作可行性。
和许多现代语言模式一样,作者也将理论模式视为一种形式化的表征,以此表述理论目标。理论表述的形式表征,大致有两大类:符号类和关系网络类。前者以符号作为表征的主要落脚点,它将语言系统视为一种符号系统,一种符号及其组织规则的系统。符号类表征形式包括生成语法的树形图、概念语义学的功能结构(Jackendoff 1990,2002)。后者以联结关系作为表征的主要落脚点,关注的是联结关系网络,并允许对各联结关系进行必要的定量分析。联结关系类形式表征包括:认知层次语法及其后来的神经认知语言学(Lamb 1966,1971)、系统功能语法(Halliday 1984)、认知构式语法等的关系网络(Goldberg 1995)。其中认知层次语法的关系网络模式最彻底,它的理论表述只用关系网络,没有符号,更没有规则,近似于神经网络(Lamb 1999;程琪龙2002)。
假设性模式验证有必要就语言系统基本特征,从架构整体到内部细节展开验证和论证。为了保证系统模式至少不悖于其动态神经生理可行性,系统模式的验证至少汇集三类证据:语言现象、大脑神经系统和系统运算。模式的合适性体现在:(1)模式可以合理处理语言现象的输入和输出;(2)模式不悖于已经被证实了的神经元联结和操作。由此可见,对模式实在性的验证依据涉及:语言现象(包括语篇中的语句)、神经科学研究结果(作为验证神经可行性的依据)、计算科学的研究结果(作为验证理论模式动态性的依据)。语言理论的科学论证基于科学公设,汇集各种相关证据,并以此有效逼近实在语言系统。
作为表述语言系统的理论模式,它同时又必须符合科学总则;它必须保持理论表述的逻辑一致性、整体概括性、预示性和经济性。有一点必须指出,这些科学总则是对理论表述而言,而并非证明语言系统具有如此基本特征。语言系统有概括的组织,也有冗长的组织,甚至含有“不符合逻辑”的义形关系。但用以表述语言系统的理论模式有必要采用:(1)一致的表征形式(即逻辑一致性);(2)尽可能多地概括系统信息(即整体概括性);(3)预示同类语言单位或组织的相同规律(即预示性);(4)相同信息量在表述形式上的简洁最大化(即经济性)。当然,在验证理论模式的科学总则之前,首先要通过汇集依据来验证理论模式是否不悖于语言系统的神经可行性和操作可行性。
4. 认知科学群的互动
汇集验证所涉及的学科范围和认知科学有高度相关性。传统的认知科学包括认知心理学、认知神经科学以及认知计算科学(人工智能科学),并以心理学理论作为导向性理论。当下的认知科学已有语言学、人类学、教育学和哲学的加入,它涵盖了可以和语言进行协同研究的诸多学科。超学科语言研究的主要协同学科至少包括认知科学的神经科学和计算科学(即人工智能);概言之,和语言研究协同工作的主要是类脑智能科学。
语言系统主要以有生命的大脑神经网络为物质载体。大脑的生理特征及其内部组织,对人类而言,已经不是黑箱了。类脑智能学科的研究成果,已经为语言超学科研究提供了许多已知信息。语言系统模式的神经生理可行性验证,可以和认知神经科学协同实施(详见4.1小节);模式的操作可行性验证,可和类脑智能来协同实施(详见4.2小节)。
4.1 神经科学的启迪
大脑神经科学的研究有两个层面的研究成果值得关注。一个是神经元层面的,一个是神经联结网层面的。任何神经科学的理论陈述中,神经元和神经网络的可操作性无需争辩。神经元的动态性具体表现为其传递神经质子的潜能。解剖学的实验揭示:随着神经元操作频率以及传递信号强度的增加,神经元在其使用中,通过提升自身的权值和阈值,传递信神经质子的能力有所提高。人们将其视为神经元的突触学习过程,并数学定义为Hebb定律(Hebb 1949)。这也证明了,神经元既有动态操作性,又有动态自调节性。
认知神经科学的成就不仅仅限于神经元层面上,在神经网络层面上也有十分可观的研究成果。通过人们对大脑功能区位图更细致的研究,人们至少确认语音主要输入于后脑的威尼克功能区位,而输出于前脑的布洛克区位。语音输入的听觉功能区位和语音输出的发音功能区位不同。如果理解和产出的概念语义功能区位相同,而听觉和发音功能区位不同,那么语言系统的动态(理解和产出)过程是双向的,而且路径不完全一致(参见Lamb 1966,1971,1999)。
神经科学在神经网络结构和功能互动方面也取得了可喜的成果。诸多脑扫描的ERP实验证明了语音、语法、语义违例的时间位置不同,各自在认知加工时具有一定的独立性(Ye et al. 1999;封世文、沈兴安、杨亦鸣 2011)。脑扫描的PET和磁共振实验揭示了语义、语法、语音、知识各子系统的存在以及它们在语言理解和产出中的不同时空关系(Turennout et al. 1998;张请芳、杨玉芳2003;Hagoort 2005,2004)。磁共振扫描数据似乎表明“动词语义”散落在大脑的各个功能区位(Huth et al. 2016)。
神经网络的语言习得发展动态性研究也取得了可喜成果。首先,人们通过研究认识到,初生婴儿的大脑神经网络基本上处于联而不通的惰性联结关系中(其中感知初级区和运动初级区除外)(Lamb 1999)。天生的大脑神经网络,充其量只是一个联结权值和阈值极低的惰性联结关系网络(程琪龙 1999)。心理学的数十年实验性研究则表明,儿童在发展形成语言系统之前,已经有了可观的感知运动认知能力和初始概念结构(Mandler 2004)。这两个发现似乎都表明,基于神经网络通路的语言系统在形成之前,大脑已经发展形成了感知运动认知系统和概念初系统的神经通路网络。结合神经元学习原理,我们有理由推导出这样一个假设:大脑语言系统是由感知系统(包括听觉系统)和概念初系统之间的神经通路网络,以及运动系统(包括发音系统)和概念初系统之间的神经通路网络,通过和语言现象互动逐步发展形成的。换言之,语言系统功能区位发展形成于感知系统—概念系统—运动系统之间的操作过程中。为此,概念系统和感知运动系统的互相激励操作,它们之间的互相促进和制约是不言而喻的。具有神经操作可行性的语言系统,一定有效联结感知运动认知系统。
4.2 人工智能研究的启迪
语言系统的动态性验证,要求语言学理论模式和人工智能技术互动。和语言有关的人工智能研究至少涉及自然语言处理(NLP)技术;以及人工神经网络(ANN)(学习)技术,其中还包括机器深度学习技术及其关系网络各模式。前者的研究认为,语言理解需要在知识库的基础上实施(Auer et al.2007;Bllacker et al.2008)。当下,更有研究者关注事件(event)的提取(Hogenboom et al. 2004;Liu et al. 2017),关注语言运用的语境,并最终和知识库(Knowledge base)以及大型数据库联结。神经认知语言学(Lamb 1999)、认知语言学诸多理论模式(Fillmore 1982;Goldberg 1995;Talmy 2000)、概念语义学等研究(Jackendoff 1990,2002)、以及概念框架和认知事件框架的认知研究(Cheng 2018;程琪龙 2006;程倩雯、程琪龙 2018),它们都注意到概念语义在语言理解中的重要意义。他们的研究和事件提取的计算研究相关度很高,值得互相借鉴。
从认知科学计算理论的角度出发,自然语言处理主要关注符号计算及其计算技术,而人工神经网络主要关注联结关系联结网络、网络操作和学习的运算及其数学公式。绝大多数语言学理论模式都立足于符号层面。因此,自然语言处理模式和语言学理论模式更接近;而人工神经网络模式,尤其是深度学习模式,它们对语言研究的依赖更少些。当然,操作于神经网络层面的人工神经网络模式更具神经动态可行性。尽管基于联结主义运算技术的深度学习,取得了有目共睹的长足进步。但是,鉴于机器深度学习本身的局限性,要再进一步推进研究的发展,进一步提高处理精确度,需要修改数学公式;这一瓶颈难以突破。当今许多认知科学专家正在试图用符号运算和联结关系运算相结合的方法来攻克举世难关。
当然,大多数理论模式都可以适当调整自身,通过运算来验证其操作可行性。但这只能证明理论模式的操作可行性。除此之外,语言系统的理论模式还需要通过神经生理可行性的验证。只有通过了相关的汇集验证,理论模式才可以更有效逼近实在语言系统。
5. 模式初建
概括上述讨论,超学科语言研究首先汇集三个方面的依据:语言现象、语言神经生理基础和语言系统的操作过程。合理的理论模式至少不悖于大脑神经科学已经探明并被证实的各种科学结论,并可以实施语言理解和产出的认知操作。要初建如此超学科理论模式,目前至少有以下四个最根本的问题需要关注:(1)理论模式的宏观架构;(2)语言符号和语符关系;(3)理论过程和认知过程;(4)概括性和使用分布。
5.1 宏观架构
脑扫描实验足以证明语言系统至少有语义、语法和语音三个子系统,并以如此顺序联结成可操作系统(理解过程则反之)。脑扫描的实验还告诉我们在神经网络运算过程中,激活的语言系统可以延续激活感知运动认知系统。这种动态操作认知过程本身表明,感知运动系统和语义系统联结。神经科学的研究成果还揭示语言系统的操作双向性。
语言学对语义划界问题,各理论模式也不相同。一般做法是将语义作为一个子系统;也有的则将语义归入概念语义,比较典型的有Jackendoff平行模式中的概念语义结构(Jackendoff 1990,2002)。认知语言学各范式,包括论元结构构式的动词语义框架(Goldberg 1995),认知语义的事件框架(Talmy 2000),以及从Talmy事件框架扩展构建的认知事件框架(Cheng 2018;程倩雯、程琪龙 2018),各自都设有百科知识或经验知识,相当于人们所说的“概念内容”或“概念语义”。
概念语义可以通过语言现象和内省方法来进一步论证。人们可以通过参与具体事件,观察这些事件,观察实施具体事件的动作。例如,“挖”事件会涉及挖的动作,挖事件涉及“挖动作者用工具施动于被挖的对象,或许最终完成并造就一个新的物质或状态(例如,一个坑)”。而如此挖事件可以有不同的细节变化,并用不同的构式来表达(Cheng 2018)。例如:
盗墓者把土挖走了 盗墓者把古董挖坏了 盗墓者把铲子挖断了
其中第1例句是使移构式,而后两句是结果构式(即使成构式)。这些不同的构式,其语义表述为不同论元结构的语义部分。笔者将如此构式语义结构归作语言语义(linguistic meaning)。尽管例句的构式语义不同,但它们都表达概括性挖事件,即它们共享挖事件的概念内容。这组例子揭示了概念语义(即认知事件框架)和语言语义(语义论元结构)的不同构;相同的概念语义可以联结多个不同的语言语义。基于概念内容和语言语义的不同构,我们可以合理推出宏观构架如下(见图1)。
5.2 语言符号和语符关系
鉴于自然语言处理的符号运算和人工神经网络的联结关系运算的利弊(参见第4.2小节讨论),许多类脑智能研究专家开始将注意力投向了符号运算和联结关系运算互补的方法。这个思路对语言系统神经生理性动态性的构建和验证具有借鉴意义。就语言理论模式而言,符号和(联结)关系并不是一定要对立的,两者只是各自的侧重点不同。符号可以视为一种符号关系,即概念内容和表达形式之间的符号关系(参见Hjelmslev 1943)。认知层次语法以及后来的神经认知语言学则进一步将概念内容和语言表达之间的语符关系分出若干个层次(或子系统)(Lamb 1971,1999;程琪龙 2002;刘宇红 2007;束定芳 2013)。
由于超学科研究涉及理论模式的神经动态可行性,所以它的侧重是语符关系(即内容和表达之间的关系),语符本身主要具备标记功能,便于学术讨论。“语言单位”的合理性取决于它的相关语符关系。表述它们的术语合适与否,仅基于它的标记和表示语词的达意性。将分析描述和理论表述的侧重点转移到语符关系上是有一定优越性的。例如,汉语语法功能的思辨一直是汉语界难以统一的议题。尽管如此,在整个关系网络中将它们相关的联结关系表述清楚,那是可以做到的。所以,语法功能问题,甚至类似语法功能的其它议题,理论上都有可能通过联结关系得到更精细而确切的表述。
在超学科框架下构建的理论模式中,概念内容和语言表达构成义形语符关系。如此语符关系从最小的形位(相当于汉语语法的“语素”)组合构成词、词组、短语、小句、复合句等最终组织构成语言系统。从语言系统的动态性出发,我们更关注不同层级之间的语符关系的运算操作(见图1),因为如此操作过程可以进一步逼近实在语言系统的理解和产出过程,从而验证系统模式的操作可行性。
5.3 理论过程和认知过程
语言学总以某种表征形式来表述一系列理论实施的过程,最终完成具体语句的表述。模式的如此理论陈述过程,可暂且称为“理论过程”。每一种理论模式都有各自的理论过程。词汇进路的理论模式,其理论表述始于词的语义,然后通过规则,派生获得论元结构,最终连接句法结构(Bresnan 1978;Foley et al. 1984)。构式进路的理论模式,其理论表述同时起于词义和构式义,然后通过词义和构式义的整合—融合原则,获得具体的实例构式,并连接相应的句法结构(Goldberg 1995,2006)。框架语义学则将语义框架视为用于句子理解的语义,其理论表述过程是由动词,激活其语义框架,框架语义又自动连接句法结构。层次语法则认为,语言系统的理论过程有两个方向,一个是从语音到语义的理解过程,一个是从语义到语音的产出过程(Lamb 1966)。
脑扫描实验的结果揭示的神经认知过程是“语音—语法—语义”的理解过程以及“语义—语法—语音”的产出过程(参见4.1小节)。我们将经过脑扫描实验获得的神经过程界定为“认知过程”。超学科的研究提倡理论模式的构建、验证和修整不悖于实在语言系统的神经生理动态性。因此,合理模式的理论过程至少不悖于已知(即已证实的或不证自明的)语言系统的认知过程。
5.4 概括性和使用分布
语言学的理论构建注重理论表述的科学概括性。大多数语言学理论甚至将概括性语言规则,视为理论表述的最高境界。超学科语言研究则认为,理论表述是对语言规律的科学表述;而所谓的科学总则是理论表述的总则。从语言系统的神经载体出发,许多概括性理论机制不是在神经网络中集中在一个功能区位,而是散布在多个功能区位。一个概括性理论机制(即规律),甚至作用于语言现象中的多个句式中。例如,语言系统存在原终图式(Source-Path-Goal Schemas)以及力变事件框架(force-dynamic event frame)。两者都是概括性很强的语言机制,甚至具有一定的普适性;研究者甚至发现原终图式存在于感知运动综合区(Dodge&Lakoff 2005)。与此同时,这两类语言机制存在于许多构式中,其中包括使移构式和结果构式。不悖于语言系统神经生理动态性的理论模式,自然会在不同构式中呈现这两个概括性很强的语言机制。
超学科研究不反对概括性超强的表征形式,我们同时注意到这些概括性机制在整个关系网络中的分布。分布式联结关系的表征形式,旨在以合理形式表述语言系统的神经生理动态性;而概括性表征则进一步探寻不同组织关系中,概括性机制的具体分布。在具体的语言使用中,前者甚至可以通过使用频次,进一步揭示不同用法的倾向性,以及倾向性机制在系统发展过程中所起的作用(参见Bybee 2007)。
6. 结论和余言
语言基本属性以及语言系统和语言现象的互为因果关系,确定了语言研究的理论目标是语言系统。基于语言基本属性,我们推导获得不证自明的语言系统的神经动态性基本特征。语言系统的一个重要研究目标就是通过理论模式,合理表述语言系统的神经动态性。由于理论模式的语言依据主要是可观察的语言现象,而语言现象和语言系统又不同构,所以理论模式一定是假设性的,需要进一步验证和论证。由于语言系统具有神经动态性基本特征,那么合理表述语言系统的理论模式,必须具有神经可行性和操作可行性。理论模式至少不悖于这两个基本特征。要验证如此基本特征,和认知科学的类脑智能研究协同工作,是最佳方略。为此,我们有理由宣称:协同工作的超学科语言研究,是逼近实在语言系统的有效方略。
具有超学科倾向的理论模式至少需要关注四类问题,并就其相关理论观点和模式表述作出选择。这四类问题分别是:宏观架构、符号和关系、理论过程和认知过程以及概括性和使用分布。通过对这四大类问题的合理思考和选择,假设的理论模式才能更有效地作为汇集验证的合理模式。
由于超学科语言研究调动了类脑智能研究协同工作,它除了能够有效逼近实在语言系统外,还为类脑智能的语言研究提供了帮助。换言之,超学科语言研究同时又反哺类脑智能研究。认知科学的研究目标是思维,而语言能将思维带入意识殿堂,如果类脑智能科学的研究多关注自然语言,类脑研究本也将得益于超学科语言研究的协同工作。可见,超学科语言研究本身,是个双赢的研究方略,它将为进一步逼近实在语言系统,同时又为思维科学研究的未来提供帮助。
作者简介:
程琪龙:男,博士,教授,博士生导师。研究方向:理论语言学和认知。